开源,会是对手打败 ChatGPT 的绝招吗?
周二,Meta 发布了最新一代的开源大语言模型 Llama 2。
与 Meta 在 2 月发布的第一代大模型 Llama 1 相比,Llama 2 在许多方面得到提升,比如训练数据比 Llama 1 多了 40%、训练所用的 token 翻了一倍,增加至 2 万亿、上下文长度限制也翻了一倍……总而言之,就是 Llama 变得更强了。
不过,使整个行业震惊的不是 Llama 2 的强大——当然,它足够强——而是 Meta 宣布 Llama 2 对研究和商用都是免费。
这也意味着众多研究机构和商业公司可免费使用开源的 Llama 2,无需自己耗费巨大的成本来开发一个大模型,降低了企业的研发成本,有利于 Meta 争取更多的合作伙伴。
目前与 Llama 2 合作的就包括了微软、亚马逊、IBM、高通、Spotify 等知名企业。
关于 Llama 2 的介绍网上已经足够多了,这里不再赘述,而本文,老狐想来介绍一下“开源”,这个在当今互联网十分常见,但大家对它却比较陌生的概念。
所谓“开源”,即开放源代码,也称源代码公开,是软件的一种散布形式,而开源软件即公开源代码的软件。
一般的软件他人仅可取得已经编译过的二进制可执行档,只有软件的作者或著作权所有者等拥有程序的源代码,这类软件称为闭源软件。
开源软件不仅仅是源代码公开,更重要的是其他人可以在开源协议的规定内对软件进行学习,修改以及出于任何目的的再分发。
开放源代码的定义最先由 Bruce Perens 提出,经由 Eric S.Raymond 发展,主要有以下十条:
虽然现在人们用到的软件,闭源居多,但最早期的软件开发,软件都是开源的,因为早期硬件发达,而软件只是附属品。
例如在 1970 年之前,IBM 出售的大规模计算机,采用的部分软件,软件公司会提供源代码,让懂程序的维护人员知道软件是如何运作的,方便修正或添加想要的功能。
后来随着软件行业的发展,软件公司意识到其中的商业利益,开始进入封闭式的开发模式,不再提供软件的源代码,人们称其为“教堂式”。
所谓教堂式,就是将软件开发比作建造一座教堂,应该由高手或专家来设计并建造,等到版本成熟时才开放提供给用户,并利用知识产权制度将开放的软件私有财产化,将其闭源,不被他人模仿,以满足企业的商业利益。
我们熟悉的 Windows 系统便是闭源软件开发模式的代表。
但闭源软件开发模式带来了一系列问题,比如软件费用高、安全漏洞多、新旧版支持问题、不符合个人需求等等,一部分软件开发者对其不满意,于是兴起了“开放源代码运动”。
开放源代码运动的支持者认为不阻碍合作、可共享的研究风气才是软件开发应有的路径,反对把软件建立在知识产权与许可证的基础之上,认为这样限制了他人利用源代码修改、调整软件以适应自身的需要,阻碍了软件的进一步完善和发展,导致软件安全性下降、创新减少、不兼容等问题。
随着开放源代码运动的进行,产生了许多实际性成果。
Richard M.Stallman 于 1985 年创立了自由软件基金会,并开启了 GUN 项目,后者是一个自由的操作系统,其内容软件完全以 GPL 的方式发布。
加州伯克利大学的计算机研究团队发展并改进了 AT&T 的 Unix 系统,建立许多应用程序,并迅速成为“BSD Unix”,后来“BSD Unix”被苹果的 macOS 采用。
1991 年,Linux 内核被芬兰一名大二学生编写出来。
1999 年,Eric S.Raymond 出版了著作《大教堂与市集》,该书讲述了黑客文化史、Linux的开发过程、以及作者本人主持开发的开放源代码软件 Fetchmail 的经历,并讨论了软件开发的方法论。《大教堂与市集》成为开放源代码活动的圣经。
与“教堂式”对应的,开源软件开发模式被称为“市集式”,就是通过不同的软件开发爱好者,组成一个不同流程和不同方式的市集,共同开发软件。
市集式的代表便是 Linux,最初由芬兰大二学生 Linus Torvalds 于 1991 年首次发布 Linux 的内核,后来无数人加入合作使其可用性增强。现如今,采用 Linux 内核的系统已经运行在很多的设备上,比如大型计算机和超级计算机、服务器、手机(安卓)、路由器、电视等等。
在前面提到了,开放源代码运动旨在追求不阻碍合作、可共享的软件开发路径,并认为开放源代码更有利于提高软件的安全性、创新性和兼容性,这是开放源代码最直接的意义。
将软件源代码公之于众,使得所有开发者都成为软件的潜在开发者,其中不乏许多优秀的网络人才,共同开发软件,能够让软件存在的漏洞很快被发现并弥补,同时,每个人的想法也能在软件上实现,促进了软件的发展和迭代,有利于软件的发展。
以上是软件开源在软件层面的意义,而像 Meta 将 Llama 2 开源,更多的是商业层面的考量,因为站在 Meta Llama 前面的是 ChatGPT 这个巨头。
Meta 将 Llama 2 开源,能争取更多的开发者支持,包括那些知名的合作企业,从而促进 Llama 的发展,提高市场占有率。过往不乏类似的案例。
Windows 从 3.0 开始取得了广泛的成功,占据了个人电脑操作系统的大部分市场,对微软不满的科技行业从业者,在 Linux 的基础上开发,将后者变成了网站和互联网应用的运行系统。
2007 年 1 月,苹果发布了初代 iPhone,并展示了强大的 iOS 系统。该年11月,谷歌向外界公布了安卓系统,与 84 家软、硬件企业以及电信运营商组成“开放手持设备联盟”,并以免费开源的方式,发布了 安卓的源代码,以此来与 iOS 竞争。
从互联网发展史来看,行业领先的巨头往往会选择闭源式开发,以保证技术领先,赚取更多的商业利益,而后来者选择开源,争取更多的市场和合作伙伴,以此抗衡行业领先者。
因此,“开源”成为部分企业以小博大的战略选择。
例如谷歌虽然不直接通过安卓系统授权获利,但却可以赚取 GMS 的授权服务费,而 Llama 如果取得成功,Meta 未来也能通过其他方式取得收益。
不过,现在站在 Meta 的 Llama 2 前面的巨头不只是 OpenAI 的 ChatGPT,还有 Google 的大语言模型 Bard——是的,将安卓开源的谷歌,在大语言模型开发上选择将 Bard 闭源。
对企业来说,开发软件选择开源还是闭源不是基于主义,商业利益才是最主要的考量因素。
不过值得一提的是,Meta 的 AI 首席科学家杨立昆是一名开源主义者,当初扎克伯格邀请他出任脸书的 AI 实验室主任一职时,他曾要求研究成果必须开源。
*杨立昆Yann LeCun
*米切尔·卡普尔
读到这里,我想大家对“开源”已经有了大概的了解。
近些年,伴随着互联网的快速发展,尤其是大数据、物联网、AI 等技术的火热,开源软件的开发者逐渐增多,相关的开源项目也越来越多,促进了开源软件行业的发展。
一向封闭的微软,也在纳德拉上任后开始拥抱开源。2014 年,微软在开源社区 Github 上开设了账户,并成为社区的最大贡献者;2018 年,微软花费 75 亿美元收购了 Github,后者当时已是全球最大的开源社区和代码托管平台;如今,微软也将与 Meta 的 Llama 展开合作。
*纳德拉和扎克伯格
开源社区 Hugging Face 伴随着 AI 的兴起,成为了开源社区的顶流,如今 Hugging Face 上有超过 25 万个模型,包括 Meta 的 Llama 2、国内王小川创立的百川智能的大语言模型“百川”。
现在回到文章开头的话题上来,小伙伴们认为 Llama 能通过开源的方式,击败闭源的 ChatGPT 和 Bard 么?
虽然结果老狐也无法预测,但非常乐意见到这样的竞争,这是一场技术落后者借助群众力量与技术领先者的竞争,也是开源的理想主义者与闭源的现实主义者的竞争,结果会怎样呢?
答案在时间里。
参考资料
财联社:Meta 发布 Llama 2 模型 与微软、高通展开合作
晚点 LastPost:Llama 2 发布,一夜之间,大模型竞争来到新起点
维基百科:“开放源代码”
石娟:开放源代码及相关知识产权法理刍论[D].重庆:西南政法大学,2007.
远川研究所:差一步称霸AI:历史进程中的扎克伯格
Web3 天空之城:杨立昆最新访谈:AI 威胁论是蒙昧主义,控制欲只有人才有
维基百科:《Dreaming in code》
虎嗅:Github 50 亿美元把自己卖了,为什么是微软呢?
编辑:木易